正则篇(七):用正则检查译文质量
在进行翻译项目管理的时候,我们经常关注的两个比较重要的点:翻译质量、翻译效率。
通过前面几章的讲解,我们看到,在进行查找替换和文件准备时,利用正则,可以提高翻译项目管理效率。那翻译质量呢,正则会有帮助吗?有什么帮助呢?
今天我们就来看看,正则是如何帮助检查译文质量的。
为什么需要检查译文质量?
在进行翻译项目管理时,项目经理通常会提前列一个check list,在CAT中,这个工具叫QA checker。
这些QA可能包含术语一致性、原文和译文的长度比例限制、上下文的一致性、目标语言的数字和大小写以及格式规范等。比如下图所见的错误:
通过QA checker,CAT工具本身可以在译员翻译的过程中自动提示质量错误。
其实这就是项目经理制定的译文质量标准,每一条标准都可能有对应的代码,如果有问题,工具可以按照这个标准把错误和问题标记出来,这样译员就知道“哦,原来这句话我犯了这个错误。我需要按照提示纠正,这样我的译文才符合规范。”
可是有的时候,我们的质量标准可能不止这么简单。比如:
数字和缩写单位之间的空格是否准确使用
不同语言之间的习惯语序差异
等等
针对这些问题,我们就可以通过正则表达式,检查出无法进行设置的质量错误。
我们一起来看几个案例。
数字和缩写单位之间的空格是否准确使用
数字和缩写单位之间的空格要取决于目标语言的规范。
案例一:25cm、25 cm, 25°cm
按常见风格手册规定,在汉译英时,数字和缩写单位之间要有一个空格。秒(s)、角度、温度及百分号除外。
但是有时候原文可能不规范,比如25cm、25 cm, 25°cm,即使如此,我们也要规范译文的表达:数字+空格+度量衡单位。我们就可以试用以下正则:
原文中查找:
(\d+)\s*cm
译文中检查:
$1 cm
若没有按照标准表述,我们就会得到一个来自QA的警告提示。
只有按照准确的译文修改完成后,错误的警告提示才会消失。
当然,如果担心其他度量衡出现,可以你能想到的度量衡一起考虑进来。正则只需要用|把各个度量衡隔开就好了。(你可以自己尝试一下~)
案例二:25% or 25 %
在法语中,百分号必须以不间断的空格隔开。
原文中查找:
(\d+)%
译文中检查:
$1 %
同样,若没有按照标准表述,就会有警告提示。
不同语言之间的习惯表达差异
语言的表达习惯要根据目标语言的标准随之发生变化。
案例三:长*宽*高
在表达尺寸的时候,中文习惯了“长*宽*高”的顺序,可如果翻译为美国英语,需要处理为“Height x Width x Depth”。
原文中查找:
长\*宽\*高
错误译文:
\(H x W x D\)
若没有按照标准翻译,就会有警告提示。
按照准确的译文修改完成后,警告提示即可消失。
案例四:25% or %25
在土耳其语和其他突厥语中,百分号位于数字前,而不是其后,且中间没有空格。所以,为了满足这一标准规范,我们就需要进行检查:
原文中查找:
(\d+)%
译文中检查:
%$1
若没有按照标准翻译,就会有警告提示。
按照准确的译文修改完成后,警告提示即可消失。
案例五:~ or -
英文不使用顿号、书名号、波浪线、6个点的省略号等符号,所以在翻译的时候要特别注意。例如,如果检查波浪线是否在英文译文中存在,就可以使用以下正则
原文中查找:
(.+?)~(.+?)
译文中检查:
$1-$2
若没有按照标准翻译,就会有警告提示。
按照准确的译文修改完成后,警告提示即可消失。
案例六:日期的译文
不同目标语言可能有不同的日期表达。我们依然可以借助正则检查日期是否符合规范。如:
原文:2021/11/29
译文:11/29/2021
则可以使用:
原文中查找:
(\d+)\/(\d+)\/(\d+)
译文中检查:
$2\/$3\/$1
若希望的原文与译文为:
原文:11/29/2021
译文:2021年11月29日
则可以使用:
原文中查找:
(\d+)\/(\d+)\/(\d+)
译文中检查:
$3年$1月$2日
当然,还有其它日期表达方式,你可以根据自己需求进行检查和调整。
设置正则警告条件
当然,在利用正则表达式进行检查的时候,我们还可以根据需求正则的警告条件,比如:
原文译文中均有禁用的正则表达式匹配
译文中有缺失的正则表达式匹配
译文中有禁用的正则表达式匹配
正则表达式计数不同
译文中正则表达式替换缺失
等等
借助正则,我们就可以很“轻松”地解决那些自带QA检查不出来的问题啦~
当然如果不太熟悉正则,可能也没那么轻松~
不过,总是要先试试嘛不是?
好啦这期正则篇先到这里,你还想学什么,欢迎来问~